本研究考虑了识别安全约束和为使用神经网络控制系统 (NNCS) 的深度强化学习 (RL) 战术自动驾驶仪开发运行时保证 (RTA) 的问题。本研究研究了 NNCS 执行自主编队飞行而 RTA 系统提供防撞和地理围栏保证的特定用例。首先,应用系统理论事故模型和过程 (STAMP) 来识别事故、危险和安全约束,并定义地面站、载人飞行长机和代理无人僚机的功能控制系统框图。然后,将系统理论过程分析 (STPA) 应用于地面站、载人飞行长机、代理无人僚机和僚机内部元素之间的交互,以识别不安全的控制动作、导致每种动作的情景以及降低风险的安全要求。这项研究是 STAMP 和 STPA 首次应用于受 RTA 约束的 NNCS。
主要关键词